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Big Data Processing 
Abstract 


The data must be processed with advanced collection and analysis tools, based on 
predetermined algorithms, in order to obtain relevant information. Algorithms must also take into 
account aspects invisible to direct perceptions. Big Data in government processes increase cost 
efficiency, productivity and innovation. Civil registries are a source for Big Data. The processed 
data helps in critical development areas such as health care, employment, economic productivity, 
crime, security and natural disaster and resource management. 


Keywords: big data 


Rezumat 


Datele trebuie procesate cu instrumente avansate de colectare şi analiză, pe baza unor 
algoritmi prestabiliți, pentru a putea obţine informaţii relevante. Algoritmii trebuie să ia în 
considerare şi aspecte invizibile pentru percepțiile directe. Big Data în procesele guvernamentale 
cresc eficiența costurilor, productivitatea și inovaţia. Registrele civile sunt o sursă pentru Big Data. 
Datele prelucrate ajută în domenii critice de dezvoltare, cum ar fi îngrijirea sănătăţii, ocuparea 
forței de muncă, productivitatea economică, criminalitatea, securitatea şi gestionarea dezastrelor 
naturale şi a resurselor. 
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Datele trebuie procesate cu instrumente avansate de colectare şi analiză, pe baza unor 
algoritmi prestabiliți, pentru a putea obţine informaţii relevante. Algoritmii trebuie să ia în 
considerare şi aspecte invizibile pentru percepțiile directe. 

În 2004 Google a publicat o lucrare despre un proces numit MapReduce care oferă un 
model de procesare paralelă. (Dean and Ghemawat 2004) De asemenea, MIKE2.0 este o aplicaţie 
în sursă deschisă pentru managementului informaţiilor. (MIKE2.0 2019) Mai multe studii din 2012 
au arătat că arhitectura optimă pentru a aborda problemele din Big Data sunt cele cu mai multe 
straturi. O arhitectură paralelă distribuită distribuie date pe mai multe servere (medii de execuţie 
paralelă) putându-se îmbunătăți astfel dramatic vitezele de procesare a datelor. 

Conform unui raport al Institutului Global McKinsey din 2011, principalele componente 
şi ecosisteme ale Big Data sunt: (Manyika et al. 2011) tehnici de analiză a datelor (învăţarea 
mașinilor, prelucrarea limbajului natural, etc.), tehnologii de mari dimensiuni (business 
intelligence, cloud computing, baze de date), şi vizualizări (diagrame, grafice, alte afişări ale 
datelor). 

Big Data furnizează informații în timp real sau aproape real, evitându-se astfel latenţa ori 


de câte ori este posibil. 


Aplicații 


Big Data în procesele guvernamentale cresc eficienţa costurilor, productivitatea şi inovaţia. 
Registrele civile sunt o sursă pentru Big Data. Datele prelucrate ajută în domenii critice de 
dezvoltare, cum ar fi îngrijirea sănătăţii, ocuparea forței de muncă, productivitatea economică, 
criminalitatea, securitatea şi gestionarea dezastrelor naturale și a resurselor. (Kvochko 2012) 

De asemenea, Big Data oferă o infrastructură care este permite evidenţierea 
incertitudinilor, a performanţei, şi disponibilitatea componentelor. Tendinţele şi predicțiile în 


industrie necesită o cantitate mare de date şi instrumente avansate de predicție. 
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Big Data contribuie la îmbunătăţirea asistenţei medicale prin furnizarea de medicamente 
personalizate şi analize prescriptive, intervenţii clinice cu evaluarea riscurilor şi analize predictive, 
etc. Nivelul datelor generate în sistemele de sănătate este foarte mare. Dar există o problemă 
presantă cu generare de "date murdare", care cresc odată cu creşterea volumului de date, mai ales 
că cele mai multe sunt nestructurate şi greu de utilizat. Utilizarea Big Data în domeniul asistenţei 
medicale a generat provocări etice semnificative, cu implicaţii asupra drepturilor individuale, viața 
privată şi autonomia, transparenţa şi încrederea. 

În media şi publicitate, pentru Big Data se folosesc numeroase puncte de informare despre 
milioane de persoane, pentru a servi sau transmite mesaje sau conținuturi personalizate. 

În domeniul asigurărilor de sănătate se colectează date despre "factorii determinanţi ai 
sănătății”, care ajută la elaborarea de previziuni privind costurile de sănătate şi identificarea 
problemele de sănătate ale clienților. Această utilizare este controversată, datorită discriminării 
clienţilor cu probleme de sănătate. (Allen 2018) 

Big Data şi tehnologia informaţiei se complementează reciproc, ajutând împreună la 
dezvoltarea Internetului Lucrurilor (Internet of Things, loT) pentru interconectarea dispozitivelor 
inteligente şi colectarea datelor senzoriale utilizate în diferite domenii. 

În sport, Big Data poate ajuta la îmbunătăți pregătirii și înţelegerea concurenţilor utilizând 
senzori specifici, şi se poate prezice performanţa viitoare a sportivilor. Senzorii ataşați mașinilor 
din Formula 1 colectează, printre altele, date din presiunea în anvelope pentru a eficientiza arderea 


combustibilului. 


În cercetare 


În ştiinţă, sistemele Big Data sunt folosite intens în acceleratoarele de particule de la CERN 
(150 de milioane de senzori transmit date de 40 de milioane de ori pe secundă, pentru cca 600 de 
milioane de coliziuni pe secundă, din care se utilizează după filtrare doar 0,001% din totalul datelor 
obţinute), (Brumfiel 2011) în telescoapele radio astrofizice construite din mii de antene, 
decodificarea genomului uman (inițial a durat câţiva ani, cu Big Data se poate realiza în mai puțin 
de o zi), studii climatice, etc. 

Marile firme IT utilizează depozite de date de ordinul zecilor de petabyte pentru căutare, 


recomandări şi merchandising. Cele mai multe date sunt colectate de Facebook, cu peste 2 miliarde 


PROCESAREA BIG DATA 


de utilizatori activi lunar, (Constine 2017) şi Google cu peste 100 de miliarde de căutări pe lună. 
(Sullivan 2015) 

În cercetare se folosește mult căutarea criptată şi formarea clusterelor în Big Data. Ţările 
dezvoltate investesc enorm în prezent pentru cercetare în Big Data. În cadrul Uniunii Europene, 
aceste cercetări sunt înglobate în programul-cadrul Orizont 2020. (European Commission 2019) 

Adesea, programele de cercetare folosesc resursele API de la Google şi Twitter pentru a 
obține acces la sistemele lor Big Data, gratuit sau contra cost. 

Seturile mari de date vin cu provocări algoritmice care anterior nu existau, fiind imperios 
necesar să se schimbe în mod fundamental modalitățile de procesare. Pentru aceasta s-au creat 
ateliere speciale de lucru care reunesc oameni de ştiinţă, statisticieni, matematicieni şi practicieni 


pentru a discuta despre provocările algoritmice ale Big Data. 
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